Ir arriba
Información de la Tesis Doctoral

Modelos para el análisis de datos: Contribuciones al aprendizaje a partir de ejemplos

Eugenio Francisco Sánchez Úbeda

Dirigida por L. Wehenkel, L. Rouco

29 de octubre de 1999

Resumen:
Tradicionalmente la Ciencia y la Ingeniería han utilizado modelos basados en principios fundamentales. Por ejemplo, la mayoría de las aplicaciones en ingeniería eléctrica se basan en modelos derivados de la teoria del electromagnetismo de Maxwell. Estos modelos se validan utilizando medidas apropiadas (datos) y técnicas clásicas de identificacón de sistemas. Además, dichas técnicas permiten estimar algunos parámetros del modelo que son difíciles de medir directamente. Sin embargo, en muchas aplicaciones reales los principios fundamentales subyacentes son desconocidos o el sistema a modelar es tan complejo que resulta intratable. Por otro lado, cada vez hay más datos disponibles, recogidos directamente del sistema o generados mediante simulación por ordenador. En estas circustancias, el aprendizaje a partir de ejemplos (AAE) puede utilizarse para obtener modelos efectivos. El AAE constituye un campo de investigación multidisciplinar que proporciona métodos para extraer información de alto nivel a partir de datos de nivel bajo. El trabajo descrito en esta tesis tiene que ver principalmente con la aplicación del AAE al análisis de datos. El término análisis de datos (data mining, en inglés), se utiliza para indicar la extracción, a partir de bases de datos, de información desconocida previamente, potencialmente útil y, en última instancia, comprensible. Para alcanzar dicho objetivo se ha proporcionado un esquema general que permite enmarcar la gran explosión de modelos basados en técnicas de AAE. Siguiendo dicho esquema, se han presentado de forma consistente un subconjunto representativo de modelos ya existentes, propuestos en campos tan dispares como la inteligencia artificial, la informática o la estadística. Además, se han tratado en detalle problemas genéricos como el dilema entre el sesgo y la varianza (the bias-variance tradeoff, en inglés). Como resultado del análisis de las prácticas actuales y de los modelos existentes en AAE, se ha desarrollado un nuevo modelo unidimensional (una sola entrada y una salida), denominado modelo Bisagras. También se han desarrollado dos extensiones multidimensionales de éste (varias entradas y salidas), denominados modelo ORTHO y OBLIQUE. El modelo Bisagras combina un modelo no paramétrico, (utilizado para producir una primera aproximación del ruido en los datos) con modelos poligonales a trozos, (bisagras), utilizados para conseguir una aproximación final compacta y sencilla de la curva subyacente. Como resultado, se ha desarrollado un algoritmo de aprendizaje muy eficiente, capaz de producir modelos útiles. Además, se han considerado bisagras lineales y cúbicas a trozos, dando lugar al llamado modelo de Bisagras Lineales y al modelo de Bisagras Suaves, respectivamente. El modelo multidimensional ORTHO es un simple modelo aditivo cuyas principales virtudes son su interpretabilidad junto con su eficiencia. Por tanto, los modelos ORTHO se pueden utilizar interactivamente mediante prueba y error, permitiendo descubrir información interesante contenida en la base de datos, así como adquirir un mayor conocimiento sobre la física del sistema. El modelo OBLIQUE es un modelo más sofisticado capaz de proporcionar unos resultados más precisos. Esta mejora en precisión supone principalmente un aumento del tiempo de CPU durante la etapa de aprendizaje. Ambos modelos pueden ser considerados como métodos de análisis de datos apropiados para problemas de dimensión real, gracias a su interpretabilidad y capacidad para identificar las variables de entrada que más influyen en la salida. Los modelos propuestos en esta tesis han sido aplicados con éxito tanto en problemas artificiales como en problemas reales. Los primeros se han utilizado para valorar fielmente los resultados obtenidos con los modelos propuestos, mientras que los segundos han permitido evaluar su utilidad práctica. En concreto, los casos de estudio se situan en el ámbito del análisis de seguridad de los sistemas eléctricos de potencia. Se ha modelado correctamente la severidad de tres contingencias diferentes. Además, dichos modelos son físicamente razonables e interpretables.



Cita:
E.F. Sánchez-Úbeda (1999), Modelos para el análisis de datos: Contribuciones al aprendizaje a partir de ejemplos. Madrid (España).


pdf Solicitar la tesis al autor